Построение графов знаний нормативной документации на основе семантического моделирования и автоматического извлечения терминов
Аннотация:
Предмет исследования. Предложено новое комплексное решение для автоматического анализа и идентификации терминов в нормативно-технической документации. Идентификация терминов в документации является актуальной задачей в цифровизации отрасли проектирования и строительства зданий и сооружений. В настоящий момент поиск и проверка требований нормативно-технической документации выполняется вручную, что влечет существенное количество ошибок. Автоматизация подобных задач позволит существенно повысить качество автоматизированного проектирования. Метод. Разработанный алгоритм основан на таких методах анализа естественного языка как токенизация, поиск лемм и основ слов, анализ стоп-слов, подсчет векторных представлений токенов и словосочетаний, частеречная и синтаксическая разметка и др. Основные результаты. Эксперименты по автоматическому извлечению терминов в нормативной документации показали большие возможности предложенного алгоритма для построения графов знаний в предметной области проектирования. Точность распознавания на примере 202 отобранных экспертами документов составила 79 % по совпадению наименований и 37 % по совпадению идентификаторов терминов. Это является сопоставимым результатом с известными подходами к решению данной проблемы. Практическая значимость. Результаты работы могут использоваться в системах автоматического проектирования на основе Building Information Modeling моделей, а также для автоматизации экспертизы проектной документации.
Ключевые слова:
Постоянный URL
Статьи в номере
- Разработка линзы бокового свечения с использованием метода композиции
- Лазерный многопараметрический метод входного контроля монтажных элементов, используемых в объеме герметичных неодимовых лазерных излучателей
- Адаптивная антитепловизионная защита подвижных объектов
- Улучшение параметрической сходимости в задачах компенсации мультисинусоидальных возмущений
- Модальная чувствительность, робастность и грубость динамических систем(обзорная статья)
- Численное моделирование функциональных характеристик солнечных элементов на основе гетероструктур InGaAsN/Si
- Золь-гель синтез Gd2O3:Nd3+ нанопорошков и исследование их люминесцентных свойств
- Инвариантный к линейным конформным преобразованиям алгоритм обнаружения размытого изображения целевого объекта малого размера
- Программная система пространственной визуализации прогностических и ретроспективных данных вероятности наблюдения полярных сияний
- Применение бэггинга при поиске аномалий сетевого трафика
- Анализ способов снижения устойчивости сетей на основе последовательного удаления ключевых элементов
- Модель устойчивого распределенного реестра для анализа безопасности многомерного блокчейна
- Влияние температурного фактора на деформационные свойства полимерных нитей и пленок
- Одношаговый метод оптимизации колеса компрессора микротурбины
- Численное моделирование влияния вязкости и турбулентности на сверхзвуковое обтекание углов сжатия и расширения
- Моделирование взаимосвязи твердости и износостойкости материалов при их сравнительном тестировании методом«block-on-ring»
- Короткоимпульсный сверхширокополосный зондирующий сигнал в задаче оценивания отражательных характеристик